全世界有数十亿人会说两种或两种以上的语言。(尽管估计结果各不相同,但许多消息来源判断,地球上一半以上的人会说双语或多语。)对这些人来说,最常见的体验之一是一种专家称之为“指令转...
解释社交媒体和新闻报道的深层含义和背景对人类来说已经相当困难,让电脑来做这件事更是一个几乎不可能完成的任务。即使是能够流利地使用超过600万种沟通方式的C-3PO(《星球大战》中的礼...
既然mBERT 是只能依靠单语数据进行学习的 zero-shot 模型,那么核心优化思路自然是为模型提供尽可能多的显式对齐线索。具体来说,需要引入跨语言数据(平行语料),并增加跨语言预训练任务。主要的实现方式如下:1. TLM(Translation Language Modeling): Mask-LM 任务的扩展...
越南信息和通信部启动越南语语音转文本生成器VAIS和文本转语音引擎Vbee。该活动是该部主办的“越南制造”数字平台系列活动的一部分。由该部支持的VAIS和Vbee是越南两个利用人工智能将语音转换为文本、反之亦然的数字化平台。VAIS能够识别来自北部、中部和南部地区的各...
主要研究领域为语言学理论、现代汉语、心理语言学、语言规划学等。著有《儿童语言的发展》《汉语量范畴研究》《语法研究录》《Language Planning in China》等,主编有《理论语言学教程...
更多内容请点击:知物由学 | 再造巴别塔,我们如何进行NLP跨语言知识迁移? 推荐文章